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J 要 上 声音 诱发 闪光 错觉 效应 是 典型 的 视听 整合 错觉 现象 ， 是 指 当 视 觉 闪光 刺激 与 间隔 100 ms 内 的 听觉 声 
音 刺 激 不 等 数量 呈现 时 ,被 试 知觉 视觉 闪光 的 数量 与 听觉 声音 的 数量 相等 。 声音 诱发 闪光 错觉 的 影响 因素 既 
包括 自 下 而 上 和 自 上 而 下 的 被 试 内 差异 因素 ,也 包括 视听 刺激 依赖 程度 、 视 听 整 合 的 发 展 和 视听 刺激 知觉 敏 
感性 等 被 试 间 差异 因素 。 该 效应 的 产生 在 时 程 上 主要 体现 在 早期 加 工 阶 段 ， 在 脑 区 上 主要 涉及 多 处 皮层 及 皮 
层 下 相关 脑 区 .。 未 来 研究 应 进一步 考察 注意 、 奖 赏 和 视听 整合 方式 等 认 知 加 工 对 声音 诱发 闪光 错觉 的 影响 ， 同 
时 也 应 该 关注 声音 诱发 闪光 错觉 对 记忆 和 学 习 的 影响 以 及 结合 计算 模型 和 神经 科学 的 手段 进一步 探讨 其 认 知 
神经 机 制 。 
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1 5l 
我 们 对 外 界 的 感知 来 自 于 多 个 感觉 系统 ,不 


Lilt 


互 作用 的 情况 下 , 视觉 通道 占 主导 。 但 在 时 间 维 度 
上 ,听觉 通道 通常 占 主导 地 位 ， 比 如 声音 诱发 闪光 


错觉 效应 (Shams, Kamitani, & Shimojo, 2000, 2002) 
同感 觉 通道 之 间 的 刺激 输入 会 发 生 交互 作用 ,多 > 
A s 和 时 间 口 技 效 应 (temporal ventriloquism) (Bertelson 


个 感觉 系统 之 间 的 整合 与 竞争 使 得 我 们 更 有 效 的 
E P k A B . & Ascherslebenc, 2003). 
对 外 界 做 出 反应 。 多 感觉 整合 是 (multisensory 声音 诱发 闪光 错觉 是 Ladan Shams 提出 的 _ 种 
y 、 yp ww H Dl E i Ay 
integration) iT HORE sia IE cy DL AGE e SI LOA LM, A 
`" Ly fas ` 、 ran NV ae HY A es ë: A > 
触觉 ) 的 信息 整合 为 统一 、 连 贯 、 称 定 的 有 意义 知 。 视觉 闪光 伴随 不 相等 数量 的 听 党 声音 在 100 ms 
部 过 程 (Stein & Stanford, 2008; XAF, SE, 。 内 相继 或 同时 呈现 时 ,个 体 错觉 性 的 将 视觉 闪光 的 
刘强 ,2011)。 多 感觉 整合 的 一 种 表现 形式 为 多 感 。 孝 量 与 听觉 声音 的 狗 量 知觉 为 相等 (Sha ot al 
觉 错 觉 效 应 (multisensory illusion)， 典 型 例子 如 麦 ae 本 x ee eae L i ee ek : 
asss sss 2000，2002)。 该 错觉 效应 被 认为 是 多 感觉 整合 中 
格 克 视觉 主导 效应 (McGurk effecD 和 声音 诱发 闪 的 经 典 错觉 现象 同时 也 被 认为 是 跨 感 觉 通 道 的 
ʻi wa > " 2 n YZEAR > H FE IEF RN DL Wd 
光 错 觉 听 觉 主 导 效 应 (Sound-induced flash illusion). s 


s i Son Oe N 双 稳 态 知觉 现象 。Shams 等 人 (2000, 2002) 首 次 采 

麦 格 克 效应 和 声音 诱发 闪光 错 觉 均 可 以 被 认为 是 ee 

re on 用 声音 诱发 闪光 错 觉 范式 进行 研究 ， 提 出 了 在 视 
跨 感 觉 通道 的 双 稳 态 知觉 现象 (bistable perception), 


听信 息 整 合 的 过 程 中 听觉 信息 可 以 主导 视觉 信息 

即 当 我 们 面 对 同 样 的 刺激 产生 两 种 不 同 的 、 相 互 w an 志 
wo 2009; PONT, A a ie s MA 
Wang, Arteaga, & He, 2013)。 虽 然 在 多 数 双 通道 交 aa ee ee 
: | ; ño 一 个 听觉 声音 间隔 23 ms 的 视觉 闪光 快速 呈现 ， 
然后 让 被 试 判断 知觉 到 的 视觉 闪光 个 数 。 结 果 发 
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et al., 2000, 2002)。 随 后 , Anderson, Tiippana 和 Sams 


(2004) 研 究 采 用 Shams 的 研究 范式 , 设置 多 个 视 
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觉 闪 光 刺 激 伴随 一 个 听觉 刺激 ， 让 被 试 报告 视觉 
闪光 个 数 。 结 果 发 现 ， 当 两 个 视觉 闪光 伴随 一 个 听 
觉 声音 时 ， 两 个 视觉 内 光 会 被 错误 知觉 为 一 个 视 
觉 闪光 ， 这 种 现象 通常 也 被 称 为 融合 错觉 Fusion 
illusion) (Abadi & Murphy, 2014; Andersen, Tiippana, 
& Sams, 2004). 

关于 声音 诱发 内 光 错 觉 效 应 产生 的 原因 主要 
归 为 两 类 ， 其 一 是 由 于 个 体 对 外 界 刺激 输入 的 主 
观 判断 导致 了 其 主观 知觉 内 光 刺 激 数量 的 改变 
(Andersen et al., 2004; Shams et al., 2002); 其 二 为 
个 体 视 知 觉 敏感 性 和 判断 标准 的 降低 McCormick, 
& Mamassian, 2008)。 造成 个 体 主 观 判 断 和 知觉 敏 
感性 变化 的 一 个 最 为 重要 的 原因 是 听觉 声音 刺激 
的 出 现 对 视觉 闪光 刺激 判断 产生 的 因果 关系 知觉 ， 
即 多 感觉 整合 中 的 因果 关系 (Shams & Beierholm, 
2010)。 多 感觉 整合 中 因果 关系 知觉 的 研究 发 现 ， 
同步 呈现 的 无 任何 提示 意义 但 与 视觉 运动 刺激 方 
向 一 致 的 听觉 刺激 能 够 促进 视 知 觉 的 加 工 (Kim， 
Peters, & Shams, 2011)。 对 于 声音 诱发 闪光 错觉 效 
JW, Shams, Ma 和 Beierholm (2005) 采 用 经 典 的 声 
音 诱 发 内 光 错 觉 范式 考察 听觉 声音 刺激 的 出 现 对 
视觉 闪光 刺激 判断 产生 的 因果 关系 。 结 果 发 现 ， 
听觉 声音 刺激 的 个 数 能 够 影响 被 试 对 于 视觉 闪光 
刺激 的 知觉 ,并 且 这 一 过 程 符合 贝 叶 斯 因果 推论 
模型 (Shams et al., 2005)。 

声音 诱发 内 光 错 觉 效 应 一 直 是 视听 整合 研究 
中 的 热点 问题 ， 自 Shams 等 人 (2000) 提 出 该 效应 
以 来 ,大量 研究 开始 关注 该 效应 的 影响 因素 和 神 
经 机 制 等 问题 。 但 目前 缺乏 全 面 且 系统 的 对 声音 
诱发 内 交错 觉 效 应 进行 综述 。 本 文 尝试 对 声音 诱 
发 闪光 错觉 进行 全 面 地 综述 。 首 先 ， 从 多 角度 出 
发 阐述 影响 声音 诱发 内 光 错 觉 的 相关 因素 ; 然后 ， 
从 多 种 神经 科学 技术 手段 阐述 声音 诱发 闪光 错觉 
的 认 知 神经 机 制 ; 最 后 ,提出 未 来 研究 的 展望 。 


2 ”声音 诱发 闪光 错觉 的 影响 因素 


21 影响 声音 诱发 闪光 错觉 被 试 内 差异 的 因素 

声音 诱发 内 光 错 觉 的 错觉 量 会 受到 某 些 因素 
的 影响 而 发 生 改 变 ， 即 在 实验 设计 中 , 不同 实验 
条 件 之 间 的 错觉 效应 不 同 。 综合 以 往 的 研究 发 现 ， 
造成 声音 诱发 内 光 错 觉 被 试 内 的 因素 主要 有 自 下 
而 上 的 物理 刺激 因素 和 自 上 而 下 的 认 知 因素 两 
大 类 。 


211 自 下 而 上 的 物理 刺激 因素 

刺激 的 空间 特征 可 以 影响 个 体 对 视听 信息 的 
加 工效 果 ， 进 而 造成 声音 诱发 内 光 错 觉 的 被 试 内 
差异 .Lewald 和 Guski (2003) 的 研究 发 现 ， 被 试 判 
断 闪 光 刺 激 的 个 数 既 取决 于 时 间 上 的 差异 ,也 取 
决 于 空间 上 的 差异 。 研 究 表明 ， 两 种 刺激 在 时 间 
和 空间 上 的 接近 对 于 体验 因果 关系 至 关 重 要 
(Lewald & Guski, 2003), Innes-Brown 和 Crewther 
(2009) 在 Shams 等 人 (2002) 的 经 典 研究 的 基础 上 
加 入 了 视听 刺激 同时 呈现 在 同 侧 位 置 以 及 呈现 异 
侧 位 置 的 条 件 ， 考察 了 视听 刺激 空间 不 一 致 性 对 
声音 诱发 内 光 错 觉 的 影响 。 结 果 表 明 ， 空 间 不 一 
致 性 对 声音 诱发 内 光 错 觉 的 产生 没有 影响 , 但 当 
视听 刺激 空间 一 致 时 , 知觉 错觉 敏感 性 逐步 提高 
(Innes-Brown & Crewther, 2009), Maté, Anette, 
Verena, Masataka 和 Uta (2015) 进 一 步 考察 了 空间 
一 致 性 的 作用 。 研 究 将 视觉 、 听 觉 刺 激 与 动态 连 
续 闪 烁 抑制 (dynamic continuous flash suppression, 
DCFS) 相 结合 ， 对 两 只 眼睛 呈现 不 同 的 视觉 刺激 。 
其 中 对 遮挡 眼睛 呈现 一 组 三 个 动态 蒙 德 里 安 , 对 
目标 眼睛 呈现 三 个 灰色 的 圆 盘 ， 位 置 分 别 为 : 左 、 
中 和 右 ， 当 其 中 一 个 圆 盘 蛙 现 内 光 时 ,听觉 刺激 
呈现 在 目标 眼睛 对 应 的 屏幕 一 侧 。 结 果 表 明 ， 同 
时 发 出 的 声音 可 以 增强 没有 意识 到 的 视觉 信号 ， 
且 这 一 过 程 依赖 于 听觉 和 视觉 信号 的 空间 一 致 
性 。 此 外 ,同时 发 出 的 声音 会 根据 闪光 的 可 见 度 影 
向 闪光 的 位 置 。 对 于 那些 被 判断 为 不 可 见 的 闪光 ， 
声音 对 于 报告 的 内 光 位 置 的 空间 偏差 最 强 (Mitk 
et al., 2015), Abadi 和 Murphy (2014) 在 Shams 等 
人 (2002) 范 式 的 基础 上 , 增添 了 空间 位 置 的 变化 
即 视觉 和 听觉 刺激 运动 方向 相同 (闪光 从 左边 运 
动 到 右边 , 声音 也 是 依次 从 左 向 右 , 为 一 致 性 刺 
激 ) 与 视觉 和 听觉 刺激 运动 方向 不 同 (办 光 从 左边 
运动 到 右边 , 声音 从 右 向 左 ， 为 不 一 致 刺激 )。 结 
RRHH, 裂变 错觉 比 融 合 错觉 效应 量 更 大 ， 且 证 
明了 视听 刺激 组 合 (空间 一 致 性 ) 对 声音 诱发 内 光 
裂变 和 融合 错觉 均 产 生 了 影响 (Abadi & Murphy, 
2014)。DeLoss 和 Andersen (2015) 在 以 往 研 究 的 
基础 上 , 增 大 了 研究 中 刺激 的 空间 差异 ， 即 将 以 
往 20? 空 间 差 异 增加 为 50"。 结 果 发 现 ,空间 差异 
对 声音 诱发 闪光 错觉 无 影响 (DeLoss & Andersen, 
2015)。 

刺激 强度 的 差异 会 影响 被 试 的 反应 , 那么 感 
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觉 通道 间 信 号 强度 的 差异 可 能 影响 声音 诱发 内 光 
错觉 效应 的 错觉 量 大 小 。Kawabe (2009) 的 研究 改 
变 了 视觉 内 光 的 亮度 (增加 视觉 内 光亮 度 )， 考察 


= 


是 否 能 够 通过 变化 视听 刺激 的 时 间 间 隔 产生 融合 
错觉 ,结果 发 现 ， 当 视听 刺激 时 间 间 隔 接 近 时 ， 声 
音 更 容易 捕获 闪光 ,导致 融合 错觉 而 且 被 试 知 
觉 到 的 闪光 亮度 是 增强 的 。 此 外 ， 当 部 分 声音 给 
予 高 频率 时 ,被 试 知觉 到 的 闪光 亮度 也 是 增强 
的 。 但 当 视 听 刺 激 时间 超 过 被 试 捕获 的 范围 ， 刺 
激 属 性 匹配 消失 。 结 果 说 明 ， 当 感觉 通道 刺激 的 
强度 发 生变 化 时 可 以 影响 声音 诱发 融合 错觉 效应 
的 强度 (Kawabe，2009)。Andersen 等 人 (2004) 在 
Shams (2002) 研 究 基 础 上 考察 声音 属性 是 否 会 影 
响声 音 诱发 内 光 错 觉 。 实 验 加 入 了 两 组 声音 强度 
刺激 ,一 组 正常 声音 强度 (80dB， 与 Shams 实验 参 
数 相 同 ) 与 一 组 低 水 平声 音 强度 (10dB， 接近 被 试 
MERR) RRHH, 裂变 错觉 在 两 组 不 同 的 声 
音 强 度 水 平 没 有 显著 性 差异 ， 即 裂变 错觉 不 受 声 
音 强 度 的 影响 , 但 是 融合 错觉 持续 出 现 直到 当 听 
觉 接近 阔 限 水 平 ， 且 融合 错觉 在 低 水 平声 音 强 度 
下 消失 。 研 究 发 现 ,被 试 知觉 到 的 融合 错觉 因 声 
音 强度 变化 而 发 生变 化 ,也 表现 出 当 外 界 刺激 输 
人 发生 改变 时 ， 错 觉 现 象 会 随 着 被 试 对 刺激 的 主 
观 判 断 而 发 生 改 变 (Andersen et al., 2004)。 研 究 表 
HJ, 裂变 错觉 较 稳 定 , 不 随 声音 强度 变化 ,而 融 
合 错觉 现象 稳定 性 较 弱 ， 容 易 受 到 刺激 条 件 变 化 
的 影响 。 此 外 , Setti 和 Chan (2011) 探 究 了 复杂 的 
视觉 刺激 是 否 影响 声音 诱发 闪光 错觉 现象 的 敏感 
性 ,结果 表明 ,被 试 在 看 到 熟悉 的 视觉 刺激 时 ， 显 
著 降低 了 声音 诱发 内 光敏 感性 ， 即 错觉 数量 减 
少 。 研 究 也 从 侧面 也 说 明了 视觉 刺激 的 强度 可 以 
影响 声音 诱发 闪光 错觉 (Setti & Chan, 2011). 
刺激 的 时 间 间 隔 被 认为 是 多 感觉 整合 中 的 重 
影响 因素 (Talsma, Senkowski, Soto-Faraco, & 
Woldorff, 2010)。 因 此 ， 视 听 刺 激 的 时 间 间 隔 可 能 
影响 个 体 对 于 视听 整合 信息 的 加 工 ， 进 而 造成 错 
觉 量 的 个 体内 变异 。Shams 等 人 (2002) 呈 现 一 个 视 
觉 闪 光 刺 激 伴随 多 个 听觉 声音 刺激 ， 要 求 被 试 对 
视觉 闪光 刺激 数量 进行 判断 。 研 究 发 现 ,声音 诱 
发 闪光 错觉 是 被 试 基于 自己 的 主观 视 知 觉 ， 并 非 
由 于 任务 难度 或 知觉 偏向 所 造成 。 并 且 一 个 强 裂 


时 间 间 隔 大 于 150 ms。 研 究 说 明了 两 个 声音 刺激 
的 时 间 窗 可 以 影响 裂变 错觉 知觉 (Shams et al., 
2002, 2005)。Zhang 和 Chen (2006) 使 用 fMRI 技术 
考察 裂变 错觉 引起 的 视觉 和 听觉 之 间 的 跨 通道 交 
互 作用 。 结 果 发 现 ， 当 听觉 和 视觉 刺激 之 间 的 刺 
激 间 隔 延 迟 为 25 ms 时 , 视觉 皮层 的 功能 磁 共 振 
成 像 信号 对 裂变 错觉 的 反应 明显 高 于 真实 的 单 闪 
光 。 当 延迟 时 间 延 长 到 300 ms 时 ,这 种 信号 增强 
消失 了 。 研 究 表明 ， 和 裂变 错觉 效应 对 视觉 皮层 的 
脑 活 动 具有 显著 的 影响 ,这 种 影响 程度 对 刺激 间 
延迟 具有 动态 敏感 性 (Zhang & Chen, 2006)。 近 期 ， 
Kostaki 和 Vatakis (2016) 进 一 步 采 用 不 同时 间 间 
隔 的 声音 诱发 内 光 错 觉 范式 考察 不 均等 数量 的 感 
觉 通道 刺激 输入 之 间 的 竞争 。 结 果 发 现 ， 裂 变 错 
觉 在 不 同 SOA 下 会 产生 不 同 的 错觉 强度 (Kostaki 
& Vatakis, 2016). 

总 体 而 言 ， 声 音 诱 发 内 光 错 觉 效 应 一 方面 容 
易 受 到 物理 刺激 因素 影响 而 产生 个 体内 变异 ， 另 
一 方面 又 具有 较 强 的 稳定 性 ， 即 不 容易 消失 ， 特 
别 是 裂变 错觉 ， 其 不 会 因为 视听 刺激 属性 的 变化 
减弱 或 消失 ,也 说 明了 裂变 错觉 是 一 种 稳定 的 错 
觉 现 象 ， 且 当 声 音 的 时 间 间 隔 较 近 时 或 当 视 觉 刺 
激 旦 现在 外 周 视 野 时 ， 和 裂变 错觉 效应 最 大 。 但 是 
融合 错觉 在 部 分 研究 中 没有 发 现 ， 可 能 由 于 研究 
中 实验 条 件 、 实 验 设备 等 影响 ,并 且 融 合 错觉 会 
受到 刺激 物理 属性 (如 声音 强度 ) 的 影响 使 之 减弱 
或 消失 ; 当 视 听 刺 激 的 时 间 间 隔 较 短 时 ， 更 容易 
发 生 融 合 错觉 现象 。 因此， 相对 裂变 错觉 而 言 ， 融 
合 错觉 效应 较 弱 且 不 稳定 。 
2.1.2 自 上 而 下 的 认 知 因素 

刺激 物理 属性 的 改变 对 声音 诱发 内 光 错 觉 存 
在 影响 。 但 即使 面 对 同 样 的 物理 刺激 ,个体 的 认 
知 状态 不 同 ,也 可 能 造成 声音 诱发 内 光 错 觉 的 错 
觉 量 不 同 ， 也 就 是 双 稳 态 知觉 过 程 中 ， 尽 管 自 下 
而 上 的 刺激 保持 不 变 , 但 产生 与 不 产生 错觉 在 感 
知 过 程 中 交替 出 现 。 此 外 ， 相 对 于 物理 刺激 这 种 
自 下 而 上 的 影响 因素 ， 自 上 而 下 的 认 知 因素 在 生 
活 中 更 为 常见 。 目 前 已 有 的 研究 主要 围绕 注意 、 
反馈 方式 和 认 知 期 望 等 因素 进行 了 研究 。 

Mishra, Martinez 和 Hillyard (2010) 提 出 声音 
诱发 视觉 错觉 不 仅 是 跨 通 道 整合 的 结果 ,应 该 还 


变 错 觉 的 产生 需要 两 个 声音 刺激 的 时 间 间 隔 低 于 
70 ms。 而 裂变 错觉 减弱 ， 则 需要 两 个 声音 刺激 的 


有 注意 分 配 的 作用 。 研 究 采 用 ERP 技 术 , 在 Shams 
等 人 (2002) 范 式 基础 上 增加 了 刺激 的 空间 位 置 (高 
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视野 和 低 视野 ) 与 是 否 注 意 (注意 和 不 注意 ) 两 个 变 
Br, 要 求 被 试 在 高 视野 或 低 视野 判断 视觉 闪光 刺 
激 数 量 。 研 究 表 明 , 在 低 视野 刺激 中 , PD120/PD110 
成 分 位 于 腹 侧 枕 、 杜 外 纹 视 觉 皮 层 ， 而 随后 的 
PD180 和 ND250/ND240 成 分 位 于 里 上 回 o I EE 
皮层 和 杜 上 回 被 认为 是 多 感觉 通道 信息 产生 交互 
的 脑 区 。 这 些 ERP 成 分 与 之 前 Mishra, Martinez, 
Sejnowski 和 Hillyard (2007) 研 究 发 现 的 声音 诱发 
闪光 错觉 的 神经 机 制 的 成 分 有 高 相似 性 ， 并且 在 
此 研究 中 加 入 注意 分 配 使 得 这 些 成 分 均 被 增强 。 
这 些 结果 证 明了 注意 分 配对 跨 通 道 交 互 与 声音 诱 
发 闪光 错觉 的 关系 存在 影响 ,说 明了 裂变 错觉 并 
不 全 是 自动 整合 加 工 的 结果 ,还 有 注意 分 配 参 与 
了 视觉 和 听觉 信号 的 整合 (Mishra et al., 2010)。 除 
了 注意 分 配 能 够 影响 声音 诱发 内 光 错 觉 之 外 ， 内 
源 性 注意 也 能 够 影响 声音 诱发 闪光 错觉 效应 。 
Georgios 和 Julian (2018) 的 研究 考察 了 内 源 性 注 
意 对 声音 诱发 闪光 错觉 的 影响 。 结 果 发 现 ,在 高 
工作 记忆 负荷 下 ， 被 试 感知 到 的 闪光 错觉 量 增加 ， 
且 与 反应 偏差 无 关 。 证 明了 视听 整合 可 以 被 认 知 
资源 的 数量 调节 ， 为 非 言 语 视听 刺激 的 整合 在 注 
意 资源 减少 的 情况 下 得 到 增强 提供 了 证 据 ， 因 此 
支持 了 自 上 而 下 的 注意 控制 在 多 感觉 整合 中 发 挥 
重要 作用 (Georgios & Julian, 2018). 同样 地 ， 于 答 ， 
王 爱 君 和 张 明 (2017) 采 用 经 典 的 声音 诱发 闪光 
错觉 的 范式 , 通过 操纵 注意 资源 的 分 配方 式 考察 
了 主动 注意 听觉 通道 的 声音 刺激 对 声音 诱发 闪光 


或 者 消除 这 种 错觉 现象 ， 即 这 种 声音 诱发 闪光 错 
觉 现象 较为 稳定 。 但 是 ， 当 给 予 被 试 货币 奖励 ( 即 
依据 被 试 结果 的 正确 率 给 予 相应 的 奖励 ) 时 ， 这 种 
错觉 性 的 主导 效应 却 有 下 降 的 趋势 (Rosenthal et al., 
2009). van Erp, Philippi 和 Werkhoven (2013) 进 一 
步 认为 ， 既 然 脑 成 像 上 可 以 发 现 错觉 闪光 和 真实 
闪光 在 视觉 皮层 的 激活 有 差异 ,那么 在 反馈 训练 
中 ,虽然 反馈 和 没有 反馈 现象 无 显著 差异 , 但 反 
馈 在 一 定 程度 上 降低 知觉 到 的 错觉 。 因 此 ， 他们 
认为 以 往 的 研究 忽略 了 真实 闪光 和 错觉 内 光 在 对 
比 度 、 强 度 和 持续 时 间 上 差异 ,并 错误 地 假定 真 
实 和 错觉 内 光 有 相似 知觉 而 且 不 能 区 分 。 因 此 
他 们 提出 增加 反应 类 型 ， 即 在 反应 一 个 内 光 和 两 
个 闪光 的 基础 上 , 增加 了 “ 某 些 事 物 不 同 于 一 个 
或 两 个 内 光 ”， 记 为 反应 类 型 3。 结 果 发 现 ,被 试 
在 按键 反应 时 ,选择 反应 类 型 3 中 有 44% 的 是 错 
觉 内 光 ， 有 4% 是 真实 闪光 ， 表明 可 能 真实 闪光 和 
错觉 内 光 在 强度 、 对 比 度 和 持续 时 间 等 特性 上 存 
在 差异 ， 而 被 试 可 以 通过 自己 来 判断 出 真实 闪 
光 。 此 外 ， 冲 突 探 测 (conflict detection) 也 可 能 会 影 
响 被 试 的 判断 反应 。 因 为 被 试 在 进行 判断 时 ， 可 
能 没有 区 分 真实 和 错觉 闪光 之 间 的 定性 差异 ， 而 
是 可 能 注意 到 了 视觉 脉冲 和 听觉 脉冲 之 间 的 “ 冲 
R”, 在 匹配 条 件 中 ,闪光 和 声音 脉冲 的 时 间 和 数 
量 是 相同 的 。 而 在 错觉 闪光 试 次 中 ,闪光 和 声音 
脉冲 的 时 间 ( 视 听 刺 激 时 间 间 隔 23 ms) 和 数量 ( 声 
音 数量 多 于 或 少 于 闪光 数量 ) 是 不 同 的 。 因 此 即使 


背 觉 产生 的 影响 。 结 果 发 现 ， 裂 变 错 觉 受到 注 
资源 分 配 程度 的 影响 , 但 融合 错觉 不 会 受到 注意 
资源 分 配 的 影响 (于 蕉 等 , 2017)。 近 期 张 明 等 人 
(2018) 将 注意 以 内 源 性 的 方式 指向 视觉 通道 或 者 
听觉 通道 ,考察 了 基于 通道 的 内 源 性 注意 对 声音 
诱发 闪光 错觉 的 影响 。 结 果 发 现 ， 当 注意 内 源 性 
地 指 问 视觉 通道 时 ， 裂变 错觉 的 量 显著 减 小 ， > 
注意 内 源 性 地 指向 听觉 通道 时 ， 裂 变 错觉 的 量 存 
在 增 大 的 趋势 。 说 明了 基于 通道 的 内 源 性 注意 可 
以 影响 声音 诱发 内 光 错 觉 中 的 裂变 错觉 ， 但 不 影 
响 融 合 错觉 ( 张 明 等 , 2018)。 

Rosenthal, Shimojo 和 Shams (2009) 采 用 Shams 
等 人 (2002) 的 研究 范式 ， 在 被 试 完成 任务 时 给 予 
被 试 任务 判断 正确 与 否 的 反馈 ,探讨 了 反馈 方式 
是 否 可 以 影响 声音 诱发 闪光 错觉 现象 。 结果 表明 
无 论 给 予 被 试 正确 与 否 的 反馈 , 均 不 能 显著 减 小 
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在 指导 语 中 说 明 被 试 反应 只 依据 被 试 视 知觉 ， 但 
被 试 对 这 种 冲突 探测 却 体现 在 被 试 反应 上 。 这 意 
味 着 被 试 并 非 依据 错觉 和 真实 闪光 的 定性 特征 ， 
而 是 依据 视觉 和 听觉 信息 之 间 的 冲突 进行 结果 判 
(van Erp et al., 2013)。 以 上 研究 表明 , 正确 的 结 
果 反 馈 并 没有 显著 影响 声音 诱发 内 光 错 觉 现象 。 
因此 ， 可 以 从 实验 结果 推断 ， 错 误 的 结果 反馈 也 
不 会 显著 影响 声音 诱发 闪光 错觉 ， 并且 虚假 反馈 
可 能 会 增加 被 试 报告 裂变 错觉 的 比例 。 通 过 van 
Erp 等 人 (2013) 的 实验 可 以 发 现 , 被 试 自身 可 能 
区 分 真实 闪光 和 错觉 内 光 , 但 具体 被 试 是 依据 
什么 判断 以 及 是 否 存在 冲突 探测 的 影响 都 有 不 确 
定性 ,还 需要 进一步 的 研究 。 综 上 这 些 研究 表明 ， 
直接 结果 反馈 ( 即 说 明 被 试 判断 正确 与 否 ) 对 声音 
诱发 闪光 错 觉 没 有 显著 影响 , 但 当 增 加 结果 反馈 
类 型 时 ( 即 反 应 类 型 增加 )， 可 以 改变 被 试 知觉 到 
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的 内 光 错 觉 。 
除了 注意 和 反馈 方式 , 还 有 研究 探讨 了 自 上 
向 下 的 认 知 期 望 对 声音 诱发 闪光 错 觉 的 影响 。 研 
究 利 用 改变 指导 语 与 实验 试 次 比例 来 操控 认 知 期 
ËB, 实验 1 和 实验 2 采用 的 三 个 指导 语 条 件 一 致 
(请 判断 闪光 个 数 "“ 含 有 两 个 闪光 的 条 件 为 80%, 
判断 闪光 个 数 ” 和 “含有 一 个 闪光 的 条 件 为 80%, 
判断 闪光 个 数 ”)， 实验 试 次 比例 不 同 ; 实验 3 中 采 
用 三 个 相同 指导 语 (“* 请 判断 闪光 个 数 "“ 所 有 实验 
条 件 出 现 的 概率 相等 ,判断 闪光 个 数 *" 和 “所 有 实 
验 条 件 出 现 的 概率 相等 ， 判断 闪光 个 数 )， 实验 试 
次 比例 与 实验 1 相 一 致 。 结 果 表 明 ， 当 指导 语 的 


存在 错觉 量 的 差异 , 不 同 组 别 的 被 试 之 间 也 存在 
声音 诱发 内 光 错 觉 的 差异 。Mishra 等 人 (2007) 的 
研究 发 现 ， 这 种 错觉 现象 在 个 体 间 的 差异 是 较 大 
的 ， 闪光 错觉 发 生 的 比例 范围 在 个 体 间 是 3%~ 
86%。 下 面 将 分 成 三 个 相关 因素 进行 阐述 ， 主 要 包 
括 对 视听 信息 依赖 程度 、 视 听 整 合 发 展 以 及 视听 
刺激 知觉 敏感 性 。 
2.2.1 ”视听 刺激 依赖 程度 

声音 诱发 内 光 错 觉 的 个 体 差 异 可 能 来 自 个 体 
对 视觉 或 听觉 信息 依赖 程度 的 差异 ， 即 对 视觉 信 
息 依赖 程度 高 的 个 体 不 易 受 到 听觉 信息 的 影响 ， 
进而 错觉 量 较 小 ; 对 听觉 信息 依赖 程度 高 的 个 体 


提示 比例 与 试 次 的 实际 比例 相 一 致 时 , 可 以 显著 
提高 观察 者 的 判断 准确 性 ， 反应 时 变 快 ; 当 指导 
语 的 提示 比例 与 试 次 的 实际 比例 不 一 致 时 ,指导 
语 依然 可 以 影响 观察 者 在 判断 裂变 错觉 时 的 准确 
性 和 反应 时 。 研 究 表明 ， 自 上 而 下 的 认 知 预期 可 
以 显著 减少 裂变 错觉 ， 加 速 被 试 的 判断 。 而 在 融 
合 错觉 中 这 种 影响 并 不 明显 ， 可 能 是 由 于 融合 错 
觉 相 对 不 稳定 性 所 导致 的 (Wang et al., 2019)。 
综 上 所 述 , 在 声音 诱发 闪光 错觉 的 被 试 内 变 
异 研究 中 ,研究 者 既 关 注 了 自 下 而 上 的 物理 刺激 
因素 对 声音 诱发 内 光 错 觉 的 影响 ,同时 也 关注 了 


容易 受到 听觉 信息 影响 ,进而 错觉 量 也 较 大 。 一 
项 研究 通过 对 比 了 音乐 家 和 非 音乐 家 对 于 声音 诱 
发 闪光 错觉 这 种 视听 信息 整合 之 间 的 差异 。 研 究 
发 现 ,受过 音乐 训练 的 人 能 够 更 快 更 准确 地 加 工 
视听 线索 ,并 且 他 们 声音 诱发 闪光 错 觉 的 能 力 增 
强 以 及 视听 信息 绑 定 的 时 间 窗 口 更 短 (Bidelman， 
2016)。 这 可 能 是 因为 音乐 家 通过 长 期 训练 使 得 听 
觉 信息 的 加 工 能 力 增强 。 另 一 项 研究 表明 ， 相 比 
于 正常 双眼 被 试 , 早年 失去 一 只 眼睛 功能 的 单眼 
被 试 声 音 诱 发 内 光 错 觉 的 错觉 量 减 小 (Moro & 
Steeves，2018)， 说 明了 视听 整合 中 出 现 的 适应 补 


一 些 认 知 因素 ， 特 别 是 自 上 而 下 的 认 知 因素 对 声 
音 诱发 闪光 错 觉 的 影响 。 物 理 刺激 因素 更 多 地 体 
现 了 声音 诱发 闪光 错觉 现象 的 产生 是 由 于 在 不 同 
的 物理 刺激 条 件 下 被 试 视 知 觉 敏感 性 降低 
(McCormick & Mamassian, 2008)。 例 如 , Kumpik, 
Roberts，King 和 Bizley (2014) 的 研究 通过 降低 视 
觉 刺 激 的 空间 可 靠 性 探讨 视觉 知觉 敏感 性 对 声音 
诱发 闪光 错觉 的 影响 。 研究 发 现 , 声音 诱发 闪光 
党 在 外 周 视野 更 常见 ， 且 被 试 知觉 到 的 裂变 错 
觉 数量 天 于 融合 错觉 数量 说 明 声 音 诱发 内 光 错 
觉 是 被 试 对 视野 范围 呈现 闪光 的 知觉 敏感 性 决 
定 。 自 上 而 下 的 认 知 因素 则 更 多 地 体现 了 声音 诱 
发 办 光 错 觉 现 象 的 产生 是 由 于 被 试 对 外 界 刺激 输 
入 的 主观 判断 导致 了 被 试 主观 知觉 闪光 刺激 数量 
的 改变 。 例 如 ，Shams 等 人 (2002) 研 究 认 为 ,， 声音 
诱发 闪光 错觉 是 被 试 基于 的 主观 视 知觉 ， 并 非 由 
于 任务 难度 或 物理 刺激 不 同 造成 的 知觉 偏向 所 造 
成 Kumpik et al., 2014)。 

2.2 ”影响 声音 诱发 闪光 错觉 被 试 间 差 异 的 因素 

声音 诱发 内 光 错 觉 效应 中 ,不同 被 试 的 之 间 


偿 现象 是 由 于 单眼 被 试 的 视觉 输入 的 降低 所 引起 
的 。 以 往 的 研究 表明 ， 当 单一 感觉 信息 不 可 靠 时 ， 
人 脑 可 以 通过 整合 多 感觉 信息 来 增强 对 外 界 的 感 
知 ， 即 当知 觉 单一 感觉 信息 的 能 力 下 降 时 ,多 感 
觉 信息 对 知觉 的 影响 更 大 。 对 于 单眼 被 试 来 说 ， 
当 视 觉 减 弱 时 ， 听 觉 可 以 提供 关于 环境 特性 的 信 
息 (Klatzky, Marston, Giudice, Golledge, & Loomis, 
2006). 

对 特殊 人 群 ( 联 觉 者 、 偏 头痛 患者 、 多 发 性 硬 
化 患者 、 弱 视 者 、 自 闭 症 谱系 障碍 患者 、 轻 度 认 
知 障碍 被 试 和 精神 分 裂 症 患 者 ) 的 声音 诱发 闪光 
错觉 研究 也 支持 上 述 观点 ， 即 对 视听 信息 依赖 程 
度 上 的 差异 可 能 影响 声音 诱发 闪光 错觉 的 个 体 间 
差异 。Whittingham, Mcdonald, & Clifford (2014) 
的 研究 发 现 , 联 觉 者 随 着 年 龄 的 增长 ,声音 诱发 
闪光 错觉 的 错觉 量 减 小 (Whittingham et al., 2014)。 
Brighina 等 人 (2015) 的 研究 发 现 ， 对 于 偏 头 痛 患 者 ， 
特别 是 在 发 作 期 间 ， 当 呈现 一 个 视觉 闪光 与 两 个 
听觉 声音 结合 时 ， 裂变 错觉 碱 小 甚至 消失 (Brighina 
et al., 2015)。Yalachkov 等 人 (2019) 的 研究 发 现 ， 多 
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发 性 硬化 患者 感知 到 的 闪光 错觉 量 多 于 正常 健康 
被 试 (Yalachkov et al., 2019), Narinesingh, Goltz 
All Wong (2017) 的 研究 发 现 ， 对 于 双眼 观察 且 听 觉 
声音 刺激 呈现 在 前 的 裂变 错觉 ， 随 着 刺激 呈现 的 
不 同步 性 增加 , 正常 被 试 表 现 出 错觉 强度 降低 ， 
而 弱视 患者 的 错觉 强度 则 保持 不 变 ， 即 弱视 组 的 
时 间 绑 定 窗口 更 宽 。 对 于 视觉 闪光 刺激 旦 现在 前 
的 融合 错觉 , 弱视 个 体 错 觉 强度 降低 (Narinesingh 
et al., 2017)。Bao, Doobay, Mottron, Collignon 和 
Bertone (2017) 的 研究 发 现 ， 自 闭 症 谱系 障碍 患者 
和 正常 发 育 个 体 都 对 裂变 错觉 具有 敏感 性 ,但 是 
自 闭 症 谱系 障碍 患者 更 容易 出 现 融 合 错觉 (Bao 
et al., 2017)。Chan 等 人 (2015) 的 研究 发 现 ， 在 较 长 
的 听觉 时 间 间 隔 内 ,与 健康 被 试 相 比 ， 轻 度 认 知 
障碍 被 试 感知 到 更 多 的 错觉 (Chan et al., 2015)。 
Vanes 等 人 (2016) 的 研究 发 现 ， 精神 分 裂 症 患 者 的 
融合 错觉 量 显著 降低 (Vanes et al., 2016)。 同 样 地 ， 
Has 等 (2017) 通 过 使 用 不 同时 间 间 隔 的 刺激 诱发 
裂变 错觉 ， 发 现 了 精神 分 裂 证 患者 与 健康 被 试 在 
视听 整合 方面 存在 差异 (Ha8 et al，2017)。 近 期 ， 
Gieseler, Tahden, Thiel 和 Colonius (2018) 考 察 了 
使 用 助听器 的 老年 人 与 未 使 用 助听器 的 轻 度 听 力 
损失 者 ( 非 使 用 助听器 者 ) 在 声音 诱发 闪光 错 觉 量 
上 的 差异 ， 并 通过 改变 刺激 开始 的 不 同步 性 来 考 
察 相应 的 整合 窗口 。 结 果 发 现 ， 轻 度 听 力 损伤 和 
助听器 的 使 用 都 会 影响 错觉 量 的 大 小 ,原因 可 能 
是 因为 助听器 的 使 用 会 逆转 听力 损失 对 视听 整合 
的 影响 (Gieseler et al., 2018)。 

总 体 而 言 , 不 同 群 体 之 间 的 比较 体现 出 了 认 
知 加 工 过 程 中 对 视觉 和 听觉 信息 的 依赖 程度 能 够 
影响 声音 诱发 内 光 错 觉 效应 出 现 的 个 体 差 异 。 具 
体 表现 为 ， 对 视觉 信息 依赖 程度 高 的 个 体 不 易 受 


影响 这 些 被 试 群 体 的 声音 诱发 内 光 错 觉 。 
2.2.2 ”视听 整合 的 发 展 

大 脑 为 了 有 效 整合 来 自 不 同感 觉 通道 的 信息 
使 用 了 时 间 绑 定 窗口 。 以 往 研 究 发 现时 间 绑 定 窗 
口 的 宽度 随 着 年 龄 的 增长 而 增加 ， 以 便 在 感觉 转 
换 下 降 时 最 大 限度 利用 多 感觉 通道 输入 的 信息 。 
DeLoss, Pierce 和 Andersen (2013) 使 用 声音 诱发 闪 
光 错 觉 范式 考察 声音 诱发 闪光 错觉 是 否 存 在 年 龄 
差异 。 结 果 发 现 ,与 年 轻 人 相 比 , 老年 人 抑制 无 关 
跨 通道 信息 能 力 降 低 ， 整 合 信息 能 力 更 强 ， 即 表 
现 出 更 多 的 错觉 现象 ， 这 一 研究 表明 ,多 感觉 整 
合 与 年 龄 存在 分 离 效 应 ， 老 年 人 更 容易 受到 多 感 
觉 整 合 的 影响 (DeLoss et al., 2013). McGovern, 
Roudaia, Stapleton, McGinnity 和 Newell (2014) 的 
研究 发 现 ， 老 年 人 即使 在 刺激 的 时 间 间 隔 (SOA) 
较 大 的 情况 下 也 会 产生 裂变 错觉 。 但 是 对 于 融合 
错觉 ,老年 人 和 年 轻 人 之 间 的 错觉 量 并 不 存在 显 
著 差 异 (McGovern et al., 2014)。 同 样 地 , Chan 等 人 
(2017) 比 较 了 年 轻 人 和 老年 人 声音 诱发 闪光 错觉 
任务 的 错觉 量 。 结 果 发 现 , 在 较 长 的 SOA 中 老年 
人 比 年 轻 人 更 容易 产生 声音 诱发 内 光 错 觉 (Chan 
et al., 2017)。 随 后 , Chan, Connolly 和 Setti (2018) 
考察 了 年 轻 人 与 老年 人 在 面 对 长 (+70、+110、 
+150, +190 和 +230) 和 短 (t70 £150 和 +230) 两 种 
不 同 SOA 时 ,是 否 对 声音 诱发 的 闪光 错觉 表现 出 
不 同 的 易 感 性 。 结 果 发 现 ,， 这 两 组 被 试 在 小 范围 
的 不 同步 性 时 ,对 错觉 表现 出 更 高 的 易 感 性 , 但 
是 仅 限于 较 长 的 时 间 窗 。 另 外 , 研究 也 发 现 改 变 
SOA 的 量 确实 会 影响 对 感知 到 错觉 量 的 敏感 性 
(Chan et al., 2018)。 

近期 , Hernández, Setti, Kenny 和 Newell (2019) 
的 研究 提供 了 关于 声音 诱发 内 光 错 觉 的 第 一 个 横 


到 听觉 信息 的 影响 ,进而 导致 声音 诱发 内 光 错 觉 
这 种 听觉 刺激 驱动 的 错觉 量 减 小 ; 对 听觉 信息 依 
赖 程度 高 的 个 体 容 易 受 到 听觉 信息 影响 ,进而 导 
致 这 种 声音 诱发 内 光 错 觉 这 种 听觉 主导 效应 增 
大 。 然 而 ， 目 前 不 同 群体 的 研究 证 据 除了 被 试 在 


向 大 数据 研究 的 证 据 。 研 究 以 3955 名 50 岁 以 上 
的 成 年 人 为 样本 ,考察 了 年 龄 、 认 知 状况 和 性 别 
对 声音 诱发 内 光 错 觉 敏 感性 的 影响 。 结 果 发 现 ， 
声音 诱发 闪光 错觉 敏感 性 的 研究 结果 与 先前 的 研 
究 一 致 ， 认 为 老化 在 多 感觉 加 工 和 增 大 的 时 间 绑 


视听 信息 依赖 程度 的 差异 之 外 ,还 可 能 会 存在 其 
他 的 影响 因素 影响 错觉 量 的 大 小 。 未 来 的 研究 一 
方面 可 以 考察 其 他 被 试 群体 声音 诱发 内 光 错 觉 的 
错觉 量 大 小 为 视听 信息 依赖 程度 这 一 影响 因素 提 
供 证 据 ， 更 为 重要 的 是 ,可 以 在 现 有 研究 的 基础 
上 进一步 量化 和 深入 考察 视听 信息 依赖 程度 如 何 


定 窗口 中 起 作用 ， 即 年 龄 越 大 、 蒙 特 利 尔 认 知 评 
佑 (MoCA) 分 数 越 低 ， 声 音 诱 发 闪光 错觉 的 敏感 
性 越 高 (Hernindez et al., 2019). O’Brien, Ottoboni, 
Tessari 和 Setti (2017) 采 用 声音 诱发 闪光 错 觉 任务 
考察 老年 人 的 视听 整合 能 力 ， 老 年 人 在 运动 前 后 
(持续 时 间 在 60 到 80 分 钟 之 间 ) 接 受 测试 ,结果 发 
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Bh, 健康 并 经 常 锻炼 的 老年 人 显示 出 更 有 效 的 多 
感觉 加 工 能 力 (O’Brien et al., 2017). Merriman, 
Whyatt, Setti, Craig 和 Newell (2015) 考 察 了 平衡 功 
能 的 改善 是 否 与 老年 人 多 感觉 加 工 能 力 的 改善 有 


效应 增强 的 原因 Laurienti，Burdette，Maldjian 和 
Wallace (2006) 认 为 可 能 是 由 于 补偿 机 制 ， 即 多 感 
觉 通 道 信 息 的 加 工 能 力 较 强 能 够 补偿 单一 感觉 通 
道 信 息 加 工 能 力 的 不 足 (Laurienti et al., 2006)。 以 


关 , 尤其 是 那些 过 去 有 跌倒 经 历 的 老年 人 。 研 究 
对 76 名 健康 且 有 跌倒 倾向 的 老年 人 进行 平衡 训 
Zk, 并 使 用 声音 诱发 内 光 融 合 错觉 任务 考察 多 感 
觉 加 工 能 力 是 否 改善 。 结 果 发 现 ,， 易 跌倒 老年 人 
的 平衡 功能 的 改善 和 多 感觉 整合 的 改善 之 间 存 在 
相关 。 表 明了 平衡 训练 干预 可 以 增强 老年 人 的 身 
体 姿 势 控 制 能 力 ， 对 易 跌倒 的 老年 人 产生 更 有 效 
的 多 感觉 加 工 (Merriman et al., 2015)。 

上 述 研究 表明 老年 人 和 年 轻 人 视听 整合 的 时 
间 窗 大 小 影响 了 声音 诱发 内 光 错 觉 的 效应 量 ,， 那 
么 什么 原因 造成 了 两 组 被 试 群体 视听 整合 的 时 间 
窗 的 差异 ? Cecere, Rees FI Romei (2015) 发 现 声 音 
诱发 内 光 错 党 现象 的 视听 刺激 整合 时 间 窗 是 


往 研究 表明 ， 当 单一 感觉 通道 信息 不 可 靠 时 ， 人 
脑 可 以 通过 整合 多 感觉 通道 的 信息 来 增强 对 外 界 
的 感知 ， 即 当知 觉 单一 感觉 通道 信息 的 加 工 能 
下 降 时 ， 多 感觉 通道 信息 的 加 工 对 个 体 的 知觉 过 
程 影 响 更 大 。 对 于 老年 人 来 说 ， 当 视觉 通道 信息 
减弱 时 ， 听 觉 通 道 信息 可 以 作为 补偿 提供 更 多 关 
于 环境 特性 的 信息 (Klatzky et al., 2006)。 
2.2.3 ”视听 刺激 知觉 敏感 性 

声音 诱发 内 光 错 觉 是 视听 整合 的 一 种 现象 ， 
被 试 对 视觉 刺激 和 听觉 刺激 加 工 过 程 中 早期 感知 
觉 阶段 的 差异 也 可 能 影响 错觉 效应 的 大 小 。 有 人 研 
究 在 Shams 等 人 (2002) 研 究 的 基础 上 ,考察 感知 觉 
敏感 性 对 声音 诱发 内 光 错 觉 的 影响 。 结 果 发 现 , 声 
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100 ms 左右 , 而 a 频段 的 振荡 活动 周期 也 是 
100 ms 左右 ， 因 此 他 们 认为 , a 频段 的 振荡 周期 可 
以 调节 视听 事件 整合 的 时 间 窗 。 研 究 也 发 现 , 个 
体 a 频率 (individual alpha frequency, IAF) 峰 值 和 
错觉 时 间 窗 的 大 小 之 间 呈 正 相 关 关系 。 此 外 研究 


音 诱发 内 光 错 觉 的 错觉 量 受 到 知觉 敏感 性 的 影响 ， 
即 知觉 敏感 性 越 低 ， 闪 光 错 觉 量 越 大 (McCormick 
& Mamassian, 2008)。Kumpik 等 人 (2014) 考 察 了 听 
觉 刺激 影响 视觉 感知 可 能 性 的 空间 因素 。 研 究 者 
通过 操纵 视觉 与 听觉 刺激 的 空间 一 致 性 、 声 音 定 


也 发 现 , 错觉 的 时 间 窗 随 a 频率 的 振荡 活动 而 变 
化 。 说 明了 a 振荡 可 以 调节 闪光 错觉 的 整合 时 间 
窗 。 因 此 , Cecere 等 人 认为 ,闪光 错觉 是 在 快速 视 
觉 刺 激 加 工 的 关键 时 间 窗 内 由 连续 的 声音 诱发 视 
觉 皮层 兴奋 性 导致 的 突然 变化 所 引起 的 现象 
(Cecere et al., 2015)。Keil 和 Senkowski (2017) 同 
样 通过 脑 电 研究 考察 了 个 体 a 频率 与 个 体 知觉 闪 
光 错 觉 的 关系 。 结 果 在 验证 Cecere 等 人 (2015) 的 
基础 上 , 扩展 了 原 有 结果 。 表 明了 个 体 a 波 频 率 
与 闪光 错觉 的 错觉 率 旦 负 相 关 ， 即 低 TAF 个 体 视 
听觉 错觉 更 强 。 并 且 源 分 析 表 明 视 觉 皮层 ， 特 别 
是 距 状 沟 参 与 表征 (Keil & Senkowski, 2017)。 
综 上 所 述 , 个 体 多 感觉 整合 能 力 越 强 ， 声音 
诱发 内 光 错 觉 量 越 大 。 相 比 于 年 轻 人 ， 老 年 人 声 
音 诱 发 内 光 错 觉 中 的 裂变 错觉 和 融合 错觉 效应 均 
更 大 (Sun et al., 2020)。 之 所 以 表现 多 感觉 错觉 效 
应 增 大 的 原因 在 于 老年 人 多 感觉 整合 能 力 可 能 比 
年 轻 人 更 强 。 例 如 ,以往 关于 多 感觉 整合 年 龄 效 
应 的 研究 表明 老年 人 的 多 感觉 整合 能 力 强 于 年 轻 
人 (Mahoney, Li, Oh-park, Verghese, & Holtzer, 
2011; DeLoss et al., 2013)。 关 于 老年 人 多 感觉 整合 


位 信和 号 的 类 型 、 视 觉 刺 激 的 离心 度 和 大 小 ， 考察 
视觉 知觉 敏感 度 在 多 大 程度 上 决定 了 闪光 错觉 的 
出 现 。 信 号 检测 论 结果 发 现 ， 声 音 诱发 内 光 错 觉 
在 外 周 视野 更 常见 ， 且 被 试 知觉 到 的 裂变 错觉 量 
大 于 融合 错觉 量 (Kumpik et al., 2014)。 

鉴于 知觉 敏感 性 能 够 影响 声音 诱发 内 光 错 觉 
的 错觉 量 , de Haas, Kanai, Jalkanen 和 Rees (2012) 
的 研究 进一步 提出 了 人 类 大 脑 结构 的 差异 造成 了 
个 体 对 声音 诱发 内 光 错 觉 敏感 性 的 差异 。 研 究 结 
果 发 现 ， 当 初级 视觉 皮层 局 部 (BA17&18) 的 灰质 
体积 较 小 时 , 被 试 更 容易 产生 错觉 ， 并且 无 论 视 
觉 刺 激 旦 现在 上 视野 还 是 下 视野 ,灰质 体积 与 被 
试 的 闪光 错觉 量 均 呈 负 相关 。 人 研究 表明 , 个 体 大 
脑 初级 视觉 皮层 的 灰质 体积 与 声音 诱发 内 光 错 觉 
有 关 (de Haas et al., 2012)。 此 外 ,已 有 研究 证 明 伽 
马 波段 (N30 Hz) 在 多 感觉 信息 加 工 中 起 着 重要 4 
JH, EWH y 氨基 丁 酸 (GABA) 神 经 传递 有 助 了 
Æ y 带 振荡 (gamma band oscillation, GBO), 其 
可 通过 激活 代谢 型 谷 氮 酸 受 体 来 维持 (Balz，Roa 
Romero et al., 2016)。 因 此 , Balz 等 人 (2016) 提 出 
GABA 和 谷 氨 酸 系统 的 差异 可 能 会 导致 多 感觉 信 
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息 加 工 的 个 体 差异 。 通 过 EEG 和 MRI 两 种 研究 


VEPs。 结 果 发 现 ,这 些 跨 通道 效应 发 生 在 枕 叶 皮 


方法 , 考察 了 GABA Als LYA(STS) PAA AR 
浓度 .局 部 GBO 和 声 诱 发 闪光 错觉 的 错觉 量 之 间 
的 关系 。 研 究 发 现 , GABA 水 平 通过 其 对 GBO 的 
调节 塑造 视听 感知 的 个 体 差 异 ，STS 中 GABA 浓 
度 与 GBO 功率 之 间 存 在 很 强 的 正 相 关 关 系 ， 
GABA 浓度 与 个 体感 知 闪光 错觉 的 可 能 性 之 间 存 
在 正 相 关 关 系 (Balz, Keil et al., 2016)。 

综 上 所 述 , 视觉 和 听觉 通道 中 刺激 知觉 敏感 
性 能 够 影响 声音 诱发 内 光 错 觉 , 表现 为 视觉 敏感 
性 降低 ， 闪 交错 觉 量 越 大 。 并 且 研 究 发 现 这 种 敏 
感性 与 大 脑 结构 的 差异 存在 关系 。 鉴 于 刺激 的 知 
党 敏感 性 能 够 影响 声音 诱发 内 光 错 觉 ， 近 期 Sun 
等 人 (2020) 通 过 在 声音 诱发 内 光 错 觉 经 典范 式 之 
前 重复 呈现 听觉 通道 的 刺激 ,考察 听觉 通道 刺激 
的 知觉 敏感 性 变化 如 何 影 响声 音 诱发 内 光 错 觉 。 
研究 结果 发 现 ,听觉 通 道 刺激 的 重复 呈现 可 以 使 
得 听觉 声音 刺激 的 敏感 性 下 降 ， 进 而 使 得 错觉 量 
降低 (Sun et al., 2020)。 因 此 , 被 试 对 于 视觉 和 听 
党 知觉 敏感 性 性 的 改变 也 被 认为 是 声音 诱发 闪光 
错觉 现象 产生 的 主要 原因 (Kumpik et al., 2014; 
McCormick & Mamassian, 2008)。 目前 现 有 的 研究 


层 。 更 重要 的 是 ， 裂变 错觉 内 光 的 VEPs 与 真实 办 
光 刺 激 的 VEPs 相似 。 结 果 表 明 , 在 视觉 皮层 中 六 
生 的 这 两 种 知觉 现象 有 着 类 似 的 大 脑 机 制 (Shams 
et al., 2001)。 此 外 , Shams 等 人 (2002) 采 用 y 频段 
(gamma band) (> 30 Hz) 振 荡 反 应 来 进一步 探究 声 
音 诱发 闪光 错觉 现象 与 无 错觉 现象 的 神经 基础 。 
ERPs 结果 发 现 ， 有 错觉 闪光 现象 出 现时 y 频段 振 
荡 显 著 高 于 没有 错觉 现象 发 生 的 试 次 , 并 且 视 听 
交互 作用 只 发 生 在 错觉 试 次 中 。 因 此 ,这 些 结果 
表明 了 声音 可 以 调节 视觉 皮层 区 域 的 加 工 ， 而 调 
节 的 强度 可 以 影响 最 终 知觉 输出 (Shams et al., 
2002)。 同 样 地 , Shams 等 (2005) 使 用 MEG 考察 了 
声音 对 视觉 的 调节 及 机 制 , 结果 发 现 ， 枕 项 叶 皮 
层 位 置 在 视觉 刺激 开始 的 35~65 ms 就 已 经 受到 了 
调节 , 在 刺激 后 不 久 (~150 ms), 枕 叶 、 顶 叶 以 及 前 
部 区 域 的 活动 也 被 调节 (Shams et al., 2005)。Mishra 
等 人 (2007) 的 研究 发 现 ， 裂 变 错觉 在 第 二 个 听觉 
声音 呈现 30~60 ms 后 产生 了 对 视觉 皮层 活动 幅 
度 的 早期 调节 (Mishra et al., 2007). Bë); Mishra, 
Martinez 和 Hillyard (2008) 的 研究 发 现 ， 融合 错 觉 
在 第 二 个 闪光 呈现 80~112 ms 后 产生 了 对 视觉 皮 


均 从 单一 的 视觉 通道 刺激 和 听觉 通道 刺激 的 知觉 
敏感 性 变化 考察 其 如 何 影响 声音 诱发 内 光 错 觉 
未 来 的 研究 可 以 从 视觉 刺激 和 听觉 刺激 知觉 敏感 
性 相对 变化 的 角度 考察 声音 诱发 内 光 错 觉 的 错觉 
量 大 小 如 何 受 到 刺激 知觉 敏感 性 的 影响 。 
3 ”声音 诱发 闪光 错觉 的 认 知 神经 机 制 
3.1 ”声音 诱发 闪光 错觉 的 时 程 机 制 

大 脑 在 接受 视听 信息 的 输入 后 ,开始 对 其 进 
行 整合 加 工 。 那 么 大 脑 在 接受 声音 诱发 内 光 错 觉 
任务 中 的 视听 刺激 后 的 不 同 阶段 是 如 何 加 工 这 些 


层 活动 幅度 的 早期 调节 (Mishra et al., 2008)。 此 外 ， 
Balz 等 (2016) 对 精神 分 裂 (SCZ) 组 和 健康 (HC) 组 进 
行 了 脑 电 图 记录 ,考察 了 声音 诱发 闪光 错觉 中 的 
神经 振荡 和 ERPs。 结 果 发 现 ,与 单一 视觉 刺激 同 
时 出 现 的 多 个 听觉 刺激 可 以 诱发 多 个 视觉 刺激 的 
错觉 。 ERPs 结果 显示 , 与 HC 相 比 ,刺激 开始 后 约 
135 ms SCZ 的 振幅 减 小 ,多 感觉 信息 加 工 产生 改 
变 。 此 外 , 与 HC 相 比 , 神经 振荡 的 分 析 表 明 SCZ 
的 枕 叶 区 域 在 100~150 ms 后 变化 为 25~35 Hz (Balz, 
Roa Romero et al., 2016). 近期 , Kaiser, Senkowski, 
Busch, Balz 和 Keil (2019) 的 研究 发 现 ,在 刺激 开 


视听 刺激 而 产生 不 同 的 错觉 ? 研究 者 通过 具有 高 
时 间 分 辨 率 的 脑 电 技术 (EEG 和 ERP) 和 脑 磁 图 技 
术 (MEG) 针 对 这 一 问题 进行 了 探讨 。 研 究 结 果 
B, 声音 诱发 内 光 错 觉 中 的 视听 觉 信息 整合 发 生 
在 认 知 加 工 的 早期 阶段 。 

Shams, Kamitani, Thompson 和 Shimojo (2001) 
使 用 ERPs 通过 视觉 诱发 电位 (VEPs) 探 究 了 裂变 
错觉 这 种 跨 通道 整合 现象 对 视 知 觉 产生 的 影响 是 
和 否 在 通道 特定 的 (modality-specific) 视 觉 通路 。 研 
究 对 比 了 有 声音 出 现 的 VEPs 和 没有 声音 呈现 的 


台 前 0.17~0.05 s， 枕 叶 电 极 在 25~41 Hz 之 间 功 率 
的 增加 可 以 预测 随后 出 现 的 声音 诱发 闪光 错觉 。 
在 错觉 试 次 和 非 错觉 试 次 之 间 ， 对 显著 性 聚 类 的 
功率 值 进行 上 检验 , 结果 显示 在 错觉 试 次 中 功率 更 
高 。 研 究 表明 , 单 次 试验 振荡 活动 可 以 预测 多 感觉 
言 号 的 整合 。 表明 了 所 观察 到 的 功率 调节 预先 处 理 
了 视听 信号 的 整合 ,为 刺激 前 振荡 在 多 感觉 加 工 中 
的 支配 作用 提供 了 进一步 证 据 (Kaiser et al., 2019)。 
3.2 ”声音 诱发 闪光 错觉 的 脑 区 

大 脑 在 加 工 声 音 诱 发 闪光 错觉 范式 中 的 视听 
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觉 信息 时 ,一 个 重要 的 问题 是 哪些 脑 区 参与 了 加 
T? 研究 者 采用 高 空间 分 辨 率 的 功能 性 磁 共 振 成 
像 (fMRI)、 经 颅 直流 电 刺激 (tDCS)、 经 颅 磁 刺激 
技术 (TMS) 和 脑 磁 图 (MEG) 等 技术 针对 这 一 问题 
进行 研究 。 研 究 结 果 表 明 ， 声 音 诱发 闪光 错 觉 中 
的 视听 觉 信息 整合 可 以 发 生 在 枕 叶 视觉 皮层 、 杜 
上 沟 、 上 丘 、 前 额 叶 和 小 脑 等 广泛 区 域 均 参 与 加 
工 了 声音 诱发 内 光 错 觉 。 

Watkins, Shams, Tanaka, Haynes 和 Rees (2006) 
通过 视网膜 皮层 映射 图 (retinotopic mapping) 的 方 
法 考察 了 声音 诱发 裂变 错觉 是 否 可 以 发 生 在 早期 
的 视觉 皮层 区 域 。 结 果 表 明 ,， 声音 改变 了 被 试 知 
DE, 反映 的 是 被 试 的 主观 知觉 而 不 是 物理 刺激 ， 
发 现 裂变 错觉 在 初级 视觉 皮层 (V1) 有 着 更 高 的 
激活 水 平 (Watkins et al., 2006)。 相反 ,他 们 关于 柄 
合 错 觉 的 研究 发 现 ,错觉 性 视觉 闪光 在 V1 皮层 
有 着 更 低 的 激活 水 平 (Watkins, Shams, Josephs, & 
Rees, 2007)。 此 外 ,经 过 全 脑 分 析 后 发 现 ， 被 激活 
的 大 脑 区 域 还 包括 里 上 沟 (superior temporal sulcus), 
EF (superior colliculus)。 同 样 地 , Zhang 和 Chen 
(2006) 采 用 动态 性 的 fMRI 也 发 现 了 声音 诱发 裂变 
错觉 发 生 在 早期 的 视觉 皮层 区 域 ， 并 且 效 应 量 的 
大 小 与 视听 刺激 间 的 间隔 存在 动态 性 的 关联 ， 除 
了 视 黄 质 视觉 感知 外 ， 大 脑 外 围 还 可 能 参与 高 级 
别 的 大 脑 处 理 过 程 (Zhang & Chen，2006)。 随 后 ， 
Jiang 和 Han (2007) 采 用 fMRI 技术 ,基于 视 知 觉 
的 收益 与 损失 来 探究 声音 诱发 内 光 错 觉 现象 的 神 
经 机 制 。 研 究 发 现 ， 视觉 内 光 伴 随 听 觉 声 音 刺 激 
同时 呈现 时 听觉 声音 刺激 会 影响 视觉 内 光 的 知觉 ， 
当 听 觉 刺 激 数量 大 于 闪光 数量 时 ,被 试 知 觉 到 了 
错觉 内 光 ， 即 知觉 收益 (perceptual gain); `' WT ié 
刺激 数量 小 于 闪光 数量 时 ,被 试 知 觉 到 的 闪光 数 
量 减 少 ， 即 知觉 损失 (perceptual loss)。 结 果 表 明 ， 
声音 诱发 闪光 错觉 现象 的 变化 是 双向 作用 的 ， 既 
可 以 产生 知觉 收益 ,又 可 以 产生 知觉 损失 。 在 知觉 
闪光 中 错觉 知觉 的 收益 激活 了 缘 上 回 (supramarginal 
gyrus) BW #H HF Æ J (prefrontal cortex) 和 小 脑 
(cerebellum)， 这 反映 出 了 与 工作 记忆 整合 加 工 相 


个 体 差异 是 否 与 大 脑 结构 中 的 灰质 体积 差异 有 
关 。 结 果 发 现 ， 当 初级 视觉 皮层 局 部 (BA17&18) 
的 灰质 体积 较 小 时 ,被 试 更 容易 知觉 错觉 (de Haas 
et al., 2012)。 

此 外 , Bolognini, Rossetti, Casati, Mancini 和 
Vallar (2011) 通 过 tDCS 改变 (增加 或 减少 ) 视 听 刺 
激 交 互 的 可 能 性 ,研究 发 现 , 通过 tDCS 上 调 或 下 
调皮 层 兴奋 性 可 以 促进 或 减少 错觉 量 ， 并 且 发 现 
里 、 枕 皮层 区 域 与 声音 诱发 内 光 错 觉 存 在 相关 
(Bolognini et al., 2011)。 近 期 , Maccora 等 人 (2019) 
在 偏 头 痛 患者 的 视觉 皮层 上 应 用 阴极 tDCS， 以 恢 
复 他 们 对 裂变 错觉 的 生理 敏感 性 。 结 果 发 现 ， 
tDCS 无 法 可 靠 地 调节 偏 头 痛 患 者 的 声音 诱发 闪 
光 错 觉 。 原 因 可 能 是 因为 阴极 tDCS 对 偏 头 痛 患 
者 皮层 兴奋 性 缺乏 作用 (Maccora et al., 2019). 
Kamke，Vieth，Cottrell 和 Mattingley (2012) 使 用 
TMS 研究 发 现 ,， 角 回 等 顶 叶 网 络 在 裂变 错觉 中 起 
到 了 整合 听觉 和 视觉 刺激 的 作用 (Kamke et al., 
2012)。Shams 等 (2005) 使 用 MEG 来 研究 声音 对 视 
觉 的 调节 及 背后 的 机 制 发 现 , 枕 顶 叶 皮 层 位 置 在 
视觉 刺激 开始 的 35~65 ms 就 已 经 受到 了 调节 , 在 
刺激 后 不 久 (~150 毫秒 ),， 桃 叶 、 项 叶 以 及 前 部 区 
域 的 活动 也 被 调节 (Shams et al., 2005). Keil, 
Müller, Hartmann 和 Weisz (2013) 使 用 MEG 研究 
EM, 在 产生 错觉 之 前 , 左 侧 里 中 回 和 听觉 区 域 
之 间 的 p 波段 相位 同步 性 增强 ， 而 视觉 区 域 的 相 
位 同步 性 减弱 (Keil et al., 2013)。Chan 等 人 (2017) 
在 记录 MEG 的 同时 ， 要 求 被 试 完成 声 诱发 的 闪光 
错觉 任务 。 结 果 发 现 , 与 年 轻 人 相 比 ， 老 年 人 在 呈 
现 裂变 错觉 中 显示 出 增强 的 B 波 带 状 前 刺激 ， 这 
表明 对 将 要 旦 现 的 刺激 产生 了 预测 。 传 递 粹 分 析 
和 前 刺激 脑 磁 图 数据 的 动态 因果 模型 显示 ,与 年 
轻 人 相 比 ， 老 年 人 的 听觉 和 视觉 皮层 之 间 的 跨 通 
道 连接 具有 更 强 的 与 错觉 相关 的 调节 (Chan et al., 
2017)。 

目前 对 声音 诱发 内 光 错 觉 的 神经 机 制 研究 主 
要 基于 单一 感觉 皮层 ， 如 初级 视觉 皮层 和 听觉 皮 
层 。 随 着 研究 的 不 断 深入 ， 越 来 越 多 的 研究 发 现 


关联 的 神经 网 络 。 而 知觉 损失 发 现 相关 的 激活 在 


声音 诱发 内 光 错 觉 不 仅 发 生 在 单一 感觉 皮层 ， 也 


内 侧 枕 叶 皮层 (medial occipital cortex) 和 丘脑 
(thalamus)， 是 与 早期 视觉 加 工 相关 的 大 脑 区 域 
(Jiang & Han, 2007)。 在 磁 共 振 成 像 中 的 结构 成 像 
中 ,de Haas 等 (2012) 考 察 了 声音 诱发 闪光 错 觉 的 


有 多 种 脑 区 的 交互 作用 ,进一步 明确 以 及 发 展 了 
声音 诱发 内 光 错 觉 的 神经 机 制 ( 表 1)。 BAK 1 中 
可 以 看 出 ， 目 前 关于 声音 诱发 内 光 错 觉 的 神经 机 
制 研 究 在 实验 设计 、 实 验 参 数 等 问题 上 还 存在 着 
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不 统一 ， 因 此 研究 结果 之 间 也 存在 一 些 差 异 。 未 
来 的 研究 应 该 整合 相关 研究 进一步 考察 声音 诱发 
闪光 错觉 的 神经 机 制 ， 并且 可 以 在 传统 分 析 的 基 
础 上 ， 结 合 功能 连通 性 的 分 析 ， 以 及 结合 静 息 态 
和 结构 像 的 数据 进行 相关 预测 性 分 析 来 进一步 探 
讨 声音 诱发 内 光 产 生 的 机 制 。 


4 BASRE 


声音 诱发 内 光 错 觉 效 应 反映 了 视听 觉 信 息 整 
合 过 程 中 听觉 信息 对 视觉 信息 感知 的 影响 。 本 文 
对 声音 诱发 闪光 错觉 效应 的 研究 进行 了 系统 性 梳 
理 ,主要 包括 : (1) 声 音 诱发 内 光 错 觉 被 试 内 差异 
的 影响 因素 , 包括 自 下 而 上 的 物理 刺激 因素 (刺激 
空间 特性 、 刺 激 强 度 差异 和 刺激 间 的 时 间 间 隔 ) 和 
自 上 而 下 的 认 知 因素 (注意 分 配 、 内 源 性 注意 、 反 
馈 方式 和 认 知 期 望 ) 等 ,还 包括 视听 刺激 依赖 程 
度 、 视 听 刺 激 整 合 的 发 展 以 及 视听 刺激 知觉 敏感 
性 等 造成 被 试 间 差 异 的 因素 。(2) 声 音 诱发 内 光 错 
觉 的 认 知 神经 机 制 , 包括 采用 EEG, ERP 和 MEG 
等 手段 考察 的 视听 整合 过 程 的 早期 加 工 阶段 ， 以 
及 采用 MRI, tDCS. TMS 和 MEG 等 手段 发 现 的 
枕 叶 视觉 皮层 、 颗 上 沟 、 上 丘 、 前 额 叶 和 小 脑 等 
广泛 加 工 声 音 诱发 内 光 错 觉 的 脑 区 。 自 声音 诱发 
闪光 错觉 效应 被 发 现 以 来 ,研究 者 们 开展 了 大 量 
的 研究 。 通 过 对 本 文 的 综述 , 不 但 能 够 系统 地 了 
解 声音 诱 发 闪光 错觉 效应 及 其 机 制 ， 同时 也 能 够 
为 视听 整合 类 的 相关 研究 提供 借鉴 。 

目前 声音 诱发 内 光 错 觉 的 研究 还 存在 一 些 局 
限 和 不 足 。 比 如 目前 仅 限 于 自身 机 制 探 讨 ， 即 一 
方面 是 影响 因素 类 研究 ， 一 方面 是 神经 机 制 类 研 
究 。 尚 待 解决 的 是 将 声音 诱发 闪光 错觉 的 研究 与 
其 他 视听 整合 类 的 研究 进行 比较 , 探究 声音 诱发 
闪光 错觉 和 其 他 视听 整合 类 研究 的 共性 问题 ， 以 
及 声音 诱发 闪光 错觉 相对 于 其 他 视听 整合 类 研究 
的 特异 性 的 问题 , 为 视听 整合 甚至 多 感觉 整合 的 
相关 研究 提供 更 多 实证 性 的 支持 。 下 面 将 结合 已 
有 研究 的 不 足 ， 提 出 未 来 研究 的 可 能 性 的 方向 。 

第 一 ,注意 对 声音 诱发 闪光 错 觉 的 影响 。 未 
来 的 研究 可 以 在 实验 研究 中 系统 地 调节 不 同 刺激 
的 竞争 程度 ,例如 通过 操纵 知觉 负载 操纵 自 上 而 
下 的 注意 ,考察 其 对 多 感觉 整合 产生 的 影响 
(Talsma, Senkowski, Woldorff, & Woldorff, 2010). 
也 可 以 在 现 有 多 感觉 整合 与 注意 交互 作用 研究 的 


基础 上 (Tang，Wu, & Shen, 2016), 探讨 不 同 注意 
模式 下 的 声音 诱发 内 光 错 觉 效 应 。 一 方面 为 影响 
声音 诱发 闪光 错觉 在 被 试 内 差异 的 因素 提供 更 多 
来 自 注 意 这 一 因素 的 实证 研究 ， 男 一 方面 也 能 够 
为 视听 整合 类 的 研究 提供 来 自 不 同感 觉 通道 权重 
不 同情 况 下 产生 的 感觉 主导 效应 的 证 据 支 持 。 

第 二 ,奖赏 对 声音 诱发 内 光 错 觉 的 影响 。 
Rosenthal 等 人 (2009) 采 用 Shams 等 人 (2002) 的 研 
究 范式 发 现 ， 在 给 予 被 试 货币 奖励 时 可 以 降低 被 
试 知觉 到 的 错觉 闪光 , 但 具体 奖励 机 制 为 什么 会 
降低 错觉 知觉 没有 过 多 研究 。 为 什么 奖励 可 以 
改变 被 试 知 觉 ?是 否 和 奖励 机 制 的 神经 基础 有 
关 ? 那么 高 奖励 和 低 奖 励 是 否 对 被 试 知觉 错觉 有 
不 同 影响 ? 未 来 研究 可 以 通过 操纵 奖赏 的 量化 等 
方式 进一步 考察 奖赏 对 声音 诱发 闪光 错觉 的 影响 ， 
一 方面 为 影响 声音 诱发 闪光 错觉 在 个 体内 变异 的 
因素 提供 更 多 来 自 奖 赏 这 一 因素 的 实证 研究 ， 另 
一 方面 也 能 够 为 奖赏 如 何 影 响 视听 整合 加 工 提供 
来 自 听觉 主导 效应 方向 的 证 据 支 持 。 

第 三 ， 视 听 整 合 的 方式 对 声音 诱发 内 光 错 觉 
的 影响 。 以 往 关 于 声音 诱发 内 光 错 觉 效应 的 研究 
均 认 为 错觉 效应 的 出 现 是 由 于 视听 刺激 在 整合 的 
过 程 中 大 脑 对 视觉 通道 和 听觉 通道 分 配 的 权重 不 
一 致 ， 导 致 整合 的 过 程 中 出 现 了 听觉 通道 信息 的 
加 工 主 导 了 视觉 通道 信息 的 加 工 位 (Zhou，Jiang， 
He, & Chen, 2010)。 但 到 底 声音 诱发 闪光 错觉 效应 
是 由 于 整合 过 程 中 出 现 了 感觉 通道 的 主导 , 还 是 
由 于 在 视觉 通道 信息 和 听觉 通道 信息 在 输入 的 过 
程 中 各 个 通道 中 信息 加 工 的 差异 导致 的 ， 目 前 还 
不 能 确定 。 未 来 研究 可 以 关注 单 通道 的 视觉 刺激 
和 单 通道 的 听觉 刺激 的 加 工 在 声音 诱发 内 光 错 觉 
中 所 起 到 的 作用 ,一 方面 能 够 明确 在 声音 诱发 内 
光 错 觉 中 视觉 与 听觉 输入 的 信息 是 先 得 到 整合 以 
后 才 在 脑 区 进一步 加 工 , 还 是 在 进入 脑 区 之 前 单 
通道 就 已 经 加 工 对 应 的 信息 然后 进一步 整合 的 。 
另 一 方面 也 能 够 考察 声音 诱发 闪光 错觉 这 种 视听 
整合 现象 与 其 他 视听 整合 现象 的 共性 与 特性 。 

第 四 ,声音 诱发 闪光 错觉 对 记忆 和 学 习 等 认 
知 过 程 的 影响 。 目 前 声音 诱发 内 光 错 觉 的 研究 主 
要 集中 在 影响 因素 和 神经 机 制 层 面 的 探讨 ， 很 少 
关注 声音 诱发 内 光 错 觉 效 应 如 何 影 响 后 续 的 认 知 
加 工 过 程 。 例 如 ,Quak, London 和 Talsma (2015) 
认为 多 感觉 通道 信息 加 工 的 方式 能 够 很 好 地 理解 
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工作 记忆 如 何 存储 和 操纵 信息 (Quak et al., 2015)。 
也 有 一 系列 的 相关 研究 对 此 问题 进行 了 探究 ,证 
实 了 多 感觉 整合 加 工 过 程 有 助 于 工作 记忆 的 编码 
All #2 HR (Barutchu, Sahu, Humphreys, & Spence, 
2019; Brunetti, Indraccolo, Mastroberardino, Spence, 
& Santangelo, 2017; Xie, Xu, Bian, & Li, 2017). Al 
此 ,未 来 研究 可 以 考察 声音 诱发 闪光 错觉 这 种 听 
党 主导 效应 类 的 视听 整合 对 工作 记忆 以 及 学 习 的 
影响 ， 一 方面 能 够 考察 声音 诱发 闪光 错觉 这 种 视 
听 整 合 现象 与 其 他 视听 整合 现象 的 共性 与 特性 。 
另 一 方面 也 能 够 扩展 声音 诱发 内 光 错 觉 的 研究 角 
度 和 思路 。 

第 五 ， 应 用 计算 模型 探讨 声音 诱发 内 光 错 觉 
的 神经 机 制 。 以 往 的 研究 从 计算 模型 的 角度 对 视 
听 整 合 中 经 典 视 觉 主导 效应 (McGurk 效 应 ) 机 制 进 
行 了 解释 (Marques, Lapenta, Costa, & Boggio, 2016; 
Samuel，2011)， 比 如 分 层 预测 编码 模型 (Olasagasti， 
Bouton, & Giraud，2015) 以 及 差异 噪声 编码 模型 
(noisy encoding of disparity model, NED) (Magnotti 
& Beauchamp, 2015)。 在 应 用 计 计 算 模 型 的 过 程 中 
尝试 先 假定 其 中 的 加 工 过 程 ， 并 利用 不 同 的 参数 
来 描述 不 同 的 加 工 过 程 ， 参 数 在 其 中 代表 的 意义 
与 特定 加 工 过程 相 对 应 ( 罗 霄 戏 ， 康 冠 兰 , 周 晓 林 ， 
2018)。 但 目前 很 少 有 声音 诱发 内 光 错 觉 效 应 的 研 
究 将 神经 生理 技术 与 计算 模型 相 结合 。 现 有 的 一 
项 关于 声音 诱发 内 光 错 觉 的 计算 模型 研究 通过 一 
个 由 两 层 视 觉 和 听觉 神经 元 组 成 的 简单 神经 网 络 
考察 声音 诱发 内 光 错 觉 中 的 视听 交互 过 程 (Cuppini， 
Magosso, Bolognini, Vallar, & Ursino, 2014) 。 未 来 
的 研究 可 以 关于 声音 诱发 内 光 错 觉 效 应 的 计算 模 
型 研究 可 以 考虑 结合 分 层 预 测 编码 模型 和 差异 噪 
声 编 码 模型 ， 利 用 EEG/ERP 、 fMRI 结果 等 神经 科 
学 指标 进行 参数 拟 合 , 或 是 神经 科学 研究 可 以 考 
虑 利用 计算 模型 寻找 相应 参数 的 对 应 脑 区 ， 为 模 
型 的 参数 找到 神经 基础 。 


参考 文献 


Be ie, 康 冠 兰 , 周 晓 林 . (2018). McGurk 效应 的 影响 因素 
pAn. OFFA SOE, 26(11), 1935-1951. 

文 小 辉 ， 李国强 ,刘强 . (2011). 视听 整合 加 工 及 其 神经 机 
fill, OEELA, 19(7), 976-982. 

Tih, EZA, SKA. (2017). 集中 和 分 散 注意 对 多 感觉 整 

合 中 听觉 主导 效应 的 影响 ， 心 静 学 兢 , 49(2), 164-173. 

SKAR, FRED, Fake, T, 王 智 楠 , 王 爱 君 . (2018). 基 


于 通道 的 内 源 性 注意 对 声音 诱发 闪光 错 觉 的 影响 ， 必 现 
IR, 50(11), 20-29. 

Abadi, R. V., & Murphy, J. S. (2014). Phenomenology of the 
sound-induced flash illusion. Experimental Brain Research, 
232(7), 2207-2220. 

Andersen, T. S., Tiippana, K., & Sams, M. (2004). Factors 
influencing audiovisual fission and fusion illusions. 
Cognitive Brain Research, 21(3), 301-308. 

Balz, J., Keil, J., Romero, Y. R., Mekle, R., Schubert, F., 
Aydin, S., ... Senkowski, D. (2016). GABA concentration 
in superior temporal sulcus predicts gamma power and 
perception in the sound-induced flash illusion. NeuroImage, 
125, 724-730. 

Balz, J., Roa Romero, Y., Keil, J., Krebber, M., Niedeggen, 
M., Gallinat, J., & Senkowski, D. (2016). Beta/Gamma 
oscillations and event-related potentials indicate aberrant 
multisensory processing in schizophrenia. Frontiers in 
Psychology, 7, 1896. 

Bao, V. A., Doobay, V., Mottron, L., Collignon, O., & Bertone, 
A. (2017). Multisensory integration of low-level information 
in autism spectrum disorder: Measuring susceptibility to 
the flash-beep illusion. Journal of Autism and Developmental 
Disorders, 47(8), 2535-2543. 

Barutchu, A., Sahu, A., Humphreys, G. W., & Spence, C. 
(2019). Multisensory processing in event-based prospective 
memory. Acta Psychologica, 192, 23-30. 

Bertelson, P., & Ascherslebenc, G. (2003). Temporal 
ventriloquism: Crossmodal interaction on the time dimension: 
Evidence from auditory—visual temporal order judgment. 
International Journal of Psychophysiology, 50(1—2), 147— 
155. 

Bidelman, G. M. (2016). Musicians have enhanced audiovisual 
multisensory binding: Experience-dependent effects in the 
double-flash illusion. Experimental Brain Research, 234(10), 
3037-3047. 

Bolognini, N., Rossetti, A., Casati, C., Mancini, F., & Vallar, 
G. (2011). Neuromodulation of multisensory perception: 
A tDCS study of the sound-induced flash illusion. 
Neuropsychologia, 49(2), 231—237. 

Brighina, F., Bolognini, N., Cosentino, G., Maccora, S., 
Paladino, P., Baschi, R., ... Fierro, B. (2015). Visual cortex 
hyperexcitability in migraine in response to sound-induced 
flash illusions. Neurology, 84(20), 2057-2061. 

Brunetti, R., Indraccolo, A., Mastroberardino, S., Spence, C., 
& Santangelo, V. (2017). The impact of cross-modal 
correspondences on working memory performance. Journal 
of Experimental Psychology: Human Perception and 
Performance, 43(4), 819-831. 

Cecere, R., Rees, G., & Romei, V. (2015). Individual differences 


in alpha frequency drive crossmodal illusory perception. 


第 10 期 ERA 等 : 多 感觉 整合 


的 声音 诱发 内 光 错 觉 效 应 1675 


Current Biology, 25(2), 231-235. 

Chan, J. S., Connolly, S. K., & Setti, A. (2018). The number 
of stimulus-onset asynchronies affects the perception of 
the sound-induced flash illusion in young and older adults. 
Multisensory Research, 31(3—4), 175—190. 

Chan, J. S., Kaiser, J., Brandl, M., Matura, S., Prvulovic, D., 
Hogan, M., & Naumer, M. J. (2015). Expanded temporal 
binding windows in people with mild cognitive impairment. 
Current Alzheimer Research, 12(1), 61—68. 

Chan, J. S., Wibral, M., Wollstadt, P., Stawowsky, C., Brandl, 
M., Helbling, S., ... Kaiser, J. (2017). Predictive coding 
over the lifespan:Increased reliance on perceptual priors in 
older adults — A magnetoencephalography and dynamic 
causal modelling study. BioRxiv, 178095. 

Cuppini, C., Magosso, E., Bolognini, N., Vallar, G., & Ursino, 
M. (2014). A neurocomputational analysis of the sound- 
induced flash illusion. NeuroImage, 92, 248-266. 

de Haas, B., Kanai, R., Jalkanen, L., & Rees, G. (2012). Grey 
matter volume in early human visual cortex predicts 
proneness to the sound-induced flash illusion. Proceedings 
of the Royal Society B: Biological Sciences, 279(1749), 
4955-4961. 

DeLoss, D. J., & Andersen, G. J. (2015). Aging, spatial 
disparity, and the sound-induced flash illusion. PLoS ONE, 
10(11), e0143773. 

DeLoss, D. J., Pierce, R. S., & Andersen, G J. (2013). 
Multisensory integration, aging, and the sound-induced 
flash illusion. Psychology Aging, 28(3), 802-812. 

Georgios, M., & Julian, K. (2018). High cognitive load 
enhances the susceptibility to non-speech audiovisual 
illusions. Scientific Reports, 8(1), 11530. 

Gieseler, A., Tahden, M. A. S., Thiel, C. M., & Colonius, H. 
(2018). Does hearing aid use affect audiovisual integration 
in mild hearing impairment? Experimental Brain Research, 
236, 1161-1179. 

HaB, K., Sinke, C., Reese, T., Roy, M., Wiswede, D., Dillo, 
W., ... Szycik, G. R. (2017). Enlarged temporal integration 
window in schizophrenia indicated by the double-flash 
illusion. Cognitive Neuropsychiatry, 22(2), 145-158. 

Hernandez, B., Setti, A., Kenny, R. A., & Newell, F. N. 
(2019). Individual differences in ageing, cognitive status, 
and sex on susceptibility to the sound-induced flash illusion: 
A large-scale study. Psychology and Aging, 34(7), 978- 
990. 

Innes-Brown, H., & Crewther, D. (2009). The impact of 
spatial incongruence on an auditory-visual illusion. PLoS 
ONE, 4(7), e6450. 

Jiang, Y., & Han, S. H. (2007). Perceptual gain and 
perceptual loss: Distinct neural mechanisms of audiovisual 


interactions. International Journal of Magnetic Resonance 


Imaging, 1(1), 1749-8023. 

Kaiser, M., Senkowski, D., Busch, N. A., Balz, J., & Keil, J. 
(2019). Single trial prestimulus oscillations predict 
perception of the sound-induced flash illusion. Scientific 
Reports, 9(1), 5983. 

Kamke, M. R., Vieth, H. E., Cottrell, D., & Mattingley, J. B. 
(2012). Parietal disruption alters audiovisual binding in 
the sound-induced flash illusion. NeuroImage, 62(3), 
1334-1341. 

Kawabe, T. (2009). Audiovisual temporal capture underlies 
flash fusion. Experimental Brain Research, 198(2-3), 
195-208. 

Keil, J., Miller, N., Hartmann, T., & Weisz, N. (2013). 
Prestimulus beta power and phase synchrony influence the 
sound-induced flash illusion. Cerebral Cortex, 24(5), 
1278-1288. 

Keil, J., & Senkowski, D. (2017). Individual alpha frequency 
relates to the sound-induced flash illusion. Multisensory 
Research, 30(6), 565-578. 

Kim, R., Peters, M. A. K., & Shams, L. (2011). 0 + 1> 1: 
How adding noninformative sound improves performance 
on a visual task. Psychological Science, 23(1), 6-12. 

Klatzky, R. L., Marston, J. R., Giudice, N. A., Golledge, R. 
G., & Loomis, J. M. (2006). Cognitive load of navigating 
without vision when guided by virtual sound versus spatial 
language. Journal of Experimental Psychology: Applied, 
12(4), 223-232. 

Kostaki, M., & Vatakis, A. (2016). Crossmodal binding 
rivalry: A “race” for integration between unequal sensory 
inputs. Vision Research, 127, 165-176. 

Kumpik, D. P., Roberts, H. E., King, A. J., & Bizley, J. K. 
(2014). Visual sensitivity is a stronger determinant of 
illusory processes than auditory cue parameters in the 
sound-induced flash illusion. Journal of Vision, 14(7), 12. 

Laurienti, P. J., Burdette, J. H., Maldjian, J. A., & Wallace, 
M. T. (2006). Enhanced multisensory integration in older 
adults. Neurobiology of Aging, 27(8), 1155-1163. 

Lewald, J., & Guski, R. (2003). Cross-modal perceptual 
integration of spatially and temporally disparate auditory 
and visual stimuli. Cognitive Brain Research, 16(3), 468— 
478. 

Maccora, S., Giglia, G., Bolognini, N., Cosentino, G., 
Gangitano, M., Salemi, G., & Brighina, F. (2019). Cathodal 
occipital tDCS is unable to modulate the sound induced 
flash illusion in migraine. Frontiers in Human Neuroscience, 
13, 247. 

Magnotti, J. F., & Beauchamp, M. S. (2015). The noisy 
encoding of disparity model of the McGurk effect. 
Psychonomic Bulletin & Review, 22(3), 701-709. 

Mahoney, J. R., Li, P. C. C., Oh-park, M., Verghese, J., & 


1676 心理 科学 进展 第 28 卷 


Holtzer, R. (2011). Multisensory integration across the 
senses in young and old adults. Brain Research, 1426(17), 
43-53. 

Marques, L. M., Lapenta, O. M., Costa, T. L., & Boggio, P. S. 
(2016). Multisensory integration processes underlying 
speech perception as revealed by the McGurk illusion. 
Language, Cognition and Neuroscience, 31(9), 1115-1129. 

Máté, A., Anette, G., Verena, C., Masataka, W., & Uta, N. 
(2015). A spatially collocated sound thrusts a flash into 
awareness. Frontiers in Integrative Neuroscience, 9, 1—8. 

McCormick, D., & Mamassian, P. (2008). "What does the 
illusory-flash look like?". Vision Research, 48(1), 63—69. 

Mcgovern, D. P., Roudaia, E., Stapleton, J., McGinnity, T. M., 
& Newell, F. N. (2014). The sound-induced flash illusion 
reveals dissociable age-related effects in multisensory 
integration. Frontiers in Aging Neuroscience, 6, 250. 

Merriman, N. A., Whyatt, C., Setti, A., Craig, C., & Newell, 
F. N. (2015). Successful balance training is associated 
with improved multisensory function in fall-prone older 
adults. Computers in Human Behavior, 45, 192-203. 

Mishra, J., Martinez, A., & Hillyard, S. A. (2008). Cortical 
processes underlying sound-induced flash fusion. Brain 
Research, 1242(4), 102-115. 

Mishra, J., Martínez, A., & Hillyard, S. A. (2010). Effect of 
attention on early cortical processes associated with the 
sound-induced extra flash illusion. Journal of Cognitive 
Neuroscience, 22(8), 1714—1729. 

Mishra, J., Martinez, A., Sejnowski, T. J., & Hillyard, S. A. 
(2007). Early cross-modal interactions in auditory and 
visual cortex underlie a sound-induced visual illusion. 
Journal of Neuroscience, 27(15), 4120-4131. 

Moro, S. S., & Steeves, J. K. E. (2018). Normal temporal 
binding window but no sound-induced flash illusion in 
people with one eye. Experimental Brain Research, 236(6), 
1825-1834. 

Narinesingh, C., Goltz, H. C., & Wong, A. M. F. (2017). 
Temporal binding window of the sound-induced flash 
illusion in amblyopia. Investigative Opthalmology & Visual 
Science, 58(3), 1442—1448. 

O’Brien, J., Ottoboni, G., Tessari, A., & Setti, A. (2017). One 
bout of open skill exercise improves cross-modal perception 
and immediate memory in healthy older adults who 
habitually exercise. PLoS ONE, 12(6), e0178739. 

Olasagasti, I., Bouton, S., & Giraud, A. L. (2015). Prediction 
across sensory modalities: A neurocomputational model of 
the McGurk effect. Cortex, 68, 61-75. 

Quak, M., London, R. E., & Talsma, D. (2015). A multisensory 
perspective of working memory. Frontiers in Human 
Neuroscience, 9, 197. 

Rosenthal, O., Shimojo, S., & Shams, L. (2009). Sound- 


induced flash illusion is resistant to feedback training. 
Brain Topography, 21(3—4), 185-192. 

Samuel, A. G. (2011). Speech perception. Annual Review of 
Psychology, 62(1), 49-72. 

Setti, A., & Chan, J. S. (2011). Familiarity of objects affects 
susceptibility to the sound-induced flash illusion. 
Neuroscience Letters, 492(1), 19—22. 

Shams, L., & Beierholm, U. R. (2010). Causal inference in 
perception. Trends in Cognitive Sciences, 14(9), 425—432. 
Shams, L., Kamitani, Y., & Shimojo, S. (2000). What you 

see is what you hear. Nature, 408(6814), 788. 

Shams, L., Kamitani, Y., & Shimojo, S. (2002). Visual illusion 
induced by sound. Cognitive Brain Research, 14(1), 147-152. 

Shams, L., Kamitani, Y., Thompson, S. M., & Shimojo, S. 
(2001). Sound alters visual evoked potentials in humans. 
Neuroreport, 12(17), 3849-3852. 

Shams, L., Ma, W. J., & Beierholm, U. (2005). Sound- 
induced flash illusion as an optimal percept. Neuroreport, 
16(17), 1923-1927. 

Stein, B. E., & Stanford, T. R. (2008). Multisensory integration: 
Current issues from the perspective of the single neuron. 
Nature Reviews Neuroscience, 9(4), 255—266. 

Sterzer, P., Kleinschmidt, A., & Rees, G. (2009). The neural 
bases of multistable perception. Trends in Cognitive Sciences, 
13(7), 310-318. 

Sun, Y. W., Liu, X. L., Li, B. L., Sava-Segal, C., Wang, A., & 
Zhang, M. (2020). Effects of repetition suppression on 
sound induced flash illusion with aging. Frontiers in 
Psychology. 11, 216. 

Talsma, D., Senkowski, D., Soto-Faraco, S., & Woldorff, M. 
G. (2010). The multifaceted interplay between attention 
and multisensory integration. Trends in Cognitive Sciences, 
14(9), 400-410. 

Tang, X. Y., Wu, J. L., & Shen, Y. (2016). The interactions of 
multisensory integration with endogenous and exogenous 
attention. Neuroscience & Biobehavioral Reviews, 61, 
208-224. 

Wang, A. J., Sang, H. B., He, J. Y., Sava-Segal, C., Tang, X. 
Y., & Zhang, M. (2019). Effects of cognitive expectation on 
sound-induced flash illusion. Perception, 48(12), 1214— 
1234. 

Wang, M., Arteaga, D., & He, B. J. (2013). Brain mechanisms 
for simple perception and bistable perception. Proceedings 
of the National Academy of Sciences of the United States 
of America, 110(35), E3350—3359. 

Watkins, S., Shams, L., Josephs, O., & Rees, G. (2007). 
Activity in human V1 follows multisensory perception. 
Neurolmage, 37(2), 572-578. 

Watkins, S., Shams, L., Tanaka, S., Haynes, J.-D., & Rees, G. 


(2006). Sound alters activity in human V1 in association 


第 10 期 ERA 等 : 多 感觉 整合 


的 声音 诱发 内 光 错 觉 效 应 1677 


with illusory visual perception. Neurolmage, 31(3), 1247— 
1256. 

Whittingham, K. M., Mcdonald, J. S., & Clifford, C. W. G. 
(2014). Synesthetes show normal sound-induced flash fission 
and fusion illusions. Vision Research, 105, 1—9. 

van Erp, J. B. F., Philippi, T. G., & Werkhoven, P. (2013). 
Observers can reliably identify illusory flashes in the 
illusory flash paradigm. Experimental Brain Research, 
226(1), 73-79. 

Vanes, L. D., White, T. P., Wigton, R. L., Joyce, D., Collier, 
T., & Shergill, S. S. (2016). Reduced susceptibility to the 
sound-induced flash fusion illusion in schizophrenia. 
Psychiatry Research, 245, 58—65. 

Xie, Y. J., Xu, Y. Y., Bian, C., & Li, M. (2017). Semantic 


congruent audiovisual integration during the encoding 
stage of working memory: An ERP and sLORETA study. 
Scientific Reports, 7(1), 5112. 

Yalachkov, Y., Bergmann, H. J., Soydaş, D., Buschenlange, 
C., Fadai Motlagh, L. Y., Naumer, M. J., ... Gehrig, J. (2019). 
Cognitive impairment in multiple sclerosis is reflected by 
increased susceptibility to the sound-induced flash illusion. 
Frontiers in Neurology, 10, 373. 

Zhang, N. Y., & Chen, W. (2006). A dynamic fMRI study of 
illusory double-flash effect on human visual cortex. 
Experimental Brain Research, 172(1), 57—66. 

Zhou, W., Jiang, Y., He, S., & Chen, D. (2010). Olfaction 
modulates visual perception in binocular rivalry. Current 
Biology, 20(15), 1356-1358. 


Sound-induced flash illusion in multisensory integration 


wa 1 s-i TES woe 1 : 2 : 1 

WANG Aijun ; HUANG Jie ;LU Feifei ; HE Jiaying ; TANG Xiaoyu“; ZHANG Ming 
(' Department of Psychology, Soochow University, Research Center for Psychology and Behavioral Sciences, Suzhou 
215123, China) Č School of Psychology, Liaoning Normal University, Liaoning Collaborative Innovation Center of 


Children and Adolescents Healthy Personality Assessment and Cultivation, Dalian 116029, China) 


Abstract: Sound-induced Flash Illusion (SiFT) is an auditory-dominated multisensory integration phenomenon 
that occurs when flashes presented in conjunction with an incongruent number of auditory sounds results in 
the flashes being perceived as equal in number to the auditory sounds. Here we summarize several factors 
that could impact on SiFI: (1) Bottom-up variance factors comprising physical properties (i.e., spatial 
characteristics of stimuli, differences in stimulus intensity, and time interval between audiovisual stimuli), 
top-down variance factors comprisingcognitive processes (i.e., attention, feedback patterns, and cognitive 
expectations), and between-subjects variance factors, such as the dependence for audiovisual stimuli, the 
ability to integrate audiovisual stimuli, and perceptual sensitivity to audiovisual stimuli; (2) Cognitive 
processing stages and neural mechanisms of SiFI (i.e., related brain regions). Future studies should focus on 
the effects of cognitive processes such as attention, reward, audiovisual integration on SiFI. The effects of 
SiFI on memory and learning should also be explored in future research. In addition, future studies 
combining computational models and neuroscience should further explore the cognitive and neural 
mechanisms of SiFI. 
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